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一 种 基于 BP 和 朴素 贝 叶 斯 的 时 间 序列 分 类 模型 ， 
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摘 要 : 针对 传统 时 间 序 列 分 类 方法 需要 较为 繁 融 的 特征 抽取 工作 以 及 在 只 有 少量 标记 数据 时 分 类 效果 不 佳 的 问题 ， 
通过 分 析 BP 神经 网 络 和 朴素 贝 叶 斯 分 类 器 的 特点 ， 提 出 一 种 基于 BP 和 朴素 贝 叶 斯 的 时 间 序 列 分 类 模型 。 利 用 了 BP 
神经 网 络 非 线性 映射 能 力 和 朴素 贝 叶 斯 分 类 器 在 少量 标记 数据 下 的 分 类 能 力 ， 将 BP 神经 网 络 抽取 到 的 特征 输入 到 村 
素 贝 叶 斯 分 类 器 中 ， 可 以 较为 有 效 的 解决 传统 时 间 序 列 分 类 算法 的 问题 。 实 验 结果 表明 ， 该 模型 在 标记 数据 较 少 的 情 
况 下 的 时 间 序 列 分 类 中 具有 较 高 的 分 类 准确 度 。 
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Time series classification model based on BP and Naive Bayes 


Wang Huiqing, Guo Zhirong, Bai Yingying 
(Dept. of Computer Science & Technology, Taiyuan University of Technology, Jinzhong Shanxi 030600, China) 


Abstract: For the low accuracy of classification caused by the lack of labeled data, and the problem of tedious feature extraction 


of the traditional time series classification method, this paper analyzed the characteristics of BP neural network and Naive Bayes 
classifier, it proposed a method based on BP and Naive Bayes. Is used the nonlinear mapping ability of BP neural network and 
the classification ability of Naive Bayes classifier under a small amount of labeled data, it input into the features extracted from 
BP neural network Naive Bayes classifier, which could solve the problem of traditional time series classification algorithm. 
Experimental results show that this model has higher classification accuracy in the classification of time series with fewer labeled 
data. 
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r= 0 引言 试 实例 建立 相应 的 分 类 器 ， 并 且 需 要 对 比 整个 数据 集 ， 所 以 采 
@O 用 基于 不 同 距 离 度量 方式 的 1-NN 方法 进行 分 类 需要 消耗 大 量 
时 间 序 列 数据 广泛 地 存在 于 天 气 、 金 融 、 农 业 、 生 物 等 各 ”的 时 间 和 空间 ["81。 在 基于 特征 的 方法 的 研究 中 ，Lin 等 人 外 提 
个 领域 。 在 过 去 的 十 几 年 间 ， 人 们 对 时 间 序 列 分 类 的 研究 兴趣 。 ”出 了 Bag-of-Words 方法 , 该 方法 量化 提取 的 到 的 特征 BoW, 并 
日 益 增 加 [31。 将 其 作为 特征 属性 输入 到 分 类 器 中 ; Baydogan 等 人 09 提 出 了 
针对 时 间 序 列 分 类 问题 的 研究 一 般 可 以 分 为 以 下 几 类 : a) ”TSBF, 提取 随机 局 部 信息 的 多 个 子 序列 , 利用 这 些 子 序列 预测 
基于 不 同 距离 度量 方式 的 1-NN 方法 ; b) 基 于 特征 的 方法 ; c) 基 ”时间 序列 的 类 别 ; Schafer 等 人 0 提出 了 BOSS， 结 合 了 基于 距 
于 深度 神经 网 络 的 方法 。 在 基于 不 同 距离 度量 方式 的 1-NN 方 离 的 分 类 器 和 使 用 符号 傅 里 叶 近 似 创建 的 时 间 序 列 的 子 结构 的 
法 的 研究 中 ，Faloutsos 等 人 外 首次 将 欧 氏 距离 用 于 时 间 序 列子 [ 方 图 信息 ，Schafer02 在 此 基础 上 ， 通 过 提出 向 量 空间 模型 来 
序列 的 匹配 算法 中 。 欧 氏 距离 对 噪声 数据 和 相位 漂移 比较 敏感 ， ”扩展 这 种 方法 ， 在 保持 性 能 的 同时 降低 了 时 间 复 杂 度 。 时 间 序 
而 DTW 能 够 较 好 地 处 理 时 间 轴 上 的 变形 ; DTW 采用 了 动态 规 。 列 一 般 是 高 纬 数据 ,经 过 特征 提取 ,可 以 有 效 防止 “维度 灾难 ”， 
划 的 思想 处 理 时 间 序 列 ， 从 而 更 容易 发 现 两 条 时 间 序 列 间 的 相 且 机 器 学 习 算 法 可 以 利用 这 些 提取 到 的 特征 向 量 来 检测 和 分 
以 性 片段 外 ，Batista 等 人 外 对 己 有 的 时 间 序 列 维度 约 减 和 相似 ”类 时 间 序 列 。 但 是 上 述 这 些 分 类 器 都 需要 大 量 的 特征 提取 工作 
性 度量 方法 做 了 统一 的 对 比 实 验 ， 并 指出 基于 DTW 的 距离 度 。 (3, 岁 。 在 基于 深度 神经 网 络 的 方法 的 研究 中 ，Karim 等 人 05 利 
量 方法 可 能 是 当前 最 好 的 度量 时 间 序 列 非 相似 性 的 方法 。 但 是 “用 MCNN， 通 过 下 采样 、 跳 跃 采样 和 滑动 窗口 来 预 处 理 数据 ， 
于 1-NN 分 类 器 是 一 种 懒惰 式 的 分 类 器 ， 它 需要 为 每 一 个 测 。 并 对 单 变量 时 间 序 列 分 类 ,但 MCNN 分 类 器 性 能 高 度 依赖 于 
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等 人 利用 FCN 和 
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以 及 该 模型 的 大 二 


ResNet 进行 时 间 序 列 的 分 类 ， 利 用 


网 络 的 优势 ， 提 供 了 一 种 


对 间 序 列 端 到 端的 分 类 方 ; 


经 网 络 的 方法 不 需 


能 获取 到 较 少 
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一 是 特征 抽 
据 较 少 的 数据 生 
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5], 


面 的 问题 ， 
大 量 的 标记 数据 进行 模 
身 较 为 珍贵 或 者 对 时 间 序 列 数据 进行 标记 较为 费时 、 费 力 ， 只 
42。 本 文 提出 一 种 
络 和 朴素 贝 叶 斯 的 时 间 序 列 分 类 模型 ， 不 用 进行 复杂 的 特征 抽 
取 工 作 ， 同 时 模型 较为 简单 ， 能 利用 
好 地 进行 学 习 ， 在 测试 集 
本 文 首先 介绍 了 时 间 序 列 分 类 问题 上 
了 提出 的 分 类 模型 ， 最 后 进 


综 上 所 述 ， 旨 


其 结构 较为 复杂 ， 需 好 


对 时 间 序 列 分 类 问题 的 


行 较为 复杂 的 特征 


是 需要 进 


。 基 于 深 


取 工 作 ， 但 
较 长 时 间 和 大 量 标记 样本 
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一 旦 . 生 
— 人 A 人 ET 
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e) 由 于 对 


的 标记 数 于 BP 神经 网 


对 间 序 列 数据 较 


的 相关 研究 ， 详 细 介绍 
E， 并 分 析 、 讨 论 结果 。 


一 种 基于 BP 和 朴素 贝 叶 斯 的 时 间 序 列 分 类 模型 


传统 的 时 间 序 列 分 类 方法 在 时 间 序 列 分 类 上 有 两 点 问题 ， 


上 也 能 有 效 训练 ， 可 以 很 方便 地 用 其 进行 特征 


区 过 程 太 过 复杂 ， 二 是 采用 的 1-NN 分 类 器 标记 数 
改 上 分 类 效果 较 差 。 本 文 提 出 自 
[朴素 贝 叶 斯 的 时 间 序 列 分 类 模型 可 
神经 网 络 的 结构 简单 ,不同 于 CNN 


于 BP 神经 网 


这 两 个 问题 。 


量 标记 数 
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虽 贝 叶 斯 所 


尽管 朴素 贝 叶 斯 分 类 器 简单 高 效 ， 但 其 应 月 
于 时 间 序 列 一 般 是 高 维 数据 ， 将 每 一 维度 当做 一 个 特 
E 的 个 数 远 远大 于 训练 样本 个 数 ， 会 产生 过 拟 合 
题 ， 导 致 分 类 效果 不 理想 。 
1.2 BP 神经 网 路 


所 有 类 另 


、 P(OPGCCIe) 
可 计算 出 p(cb)_ so， 


argmaxp(clx) = argmaxP(c) IIz P(xi|c), 
cey CEY 
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1 P(x) 相 同 , 朴素 贝 叶 斯 分 类 器 即 为 hpnp = 


日 于 时 间 序 列 数 
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申 经 网 络 模型 是 日 前 应 用 最 为 广泛 和 成 功 的 神经 网 络 
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输入 
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方法 ，NB 假定 样 
多。 朴素 贝 叶 其 
的 参数 (变量 的 均值 和 方差 )， 对 名 


独立 上 
必要 


类 模型 具有 实现 简单 、 分 类 速度 


朴素 贝 叶 斯 


叶 斯 分 类 器 实现 简单 ， 在 标记 数据 较 少 上 


朴素 贝 叶 斯 算法 是 者 


单 假设 所 建立 的 一 种 贝 叶 斯 


表示 训练 集 D 中 第 c 类 样本 组 成 的 身 
b) 估 计 训 练 样本 中 第 i 个 特征 在 3 
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1 
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值 为 xi 的 样本 组 成 的 全 
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a) 估 计 训 练 样本 


上 离散 属性 而 言 p(xilc) = 


段 设 有 训练 和 
分 类 样本 ， 共 有 d 个 居 
基于 训练 集 D 来 估计 类 9 
条 件 概率 P(xi|c)。 划 


FP 类 别 c 的 先 验 概率 P(c) = 


抽取 ; 而 朴 
的 数据 集 上 表现 较 


类 影响 是 相互 
练 数 据 估计 出 
匆 据 不 太 敏 感 。 该 分 
R、 准确 度 高 的 特点 。 

芸 D, 有 N 种 可 能 的 类 别 标记 Y = {c1, cz,.…,cw}， 
晶 性 。 朴 素 贝 叶 斯 分 类 器 的 训练 过 
E 验 概率 P(c)， 并 为 每 个 属性 估计 


。 上 其 中 : Dc 


bt 现 的 条 件 概率 。 


性 而 言 p(xilc) = 


i 2 
exp( 一 下 人)。 其 中 ， De 表示 De 中 在 第 i 个 属性 上 取 


c 类 样本 在 第 i 


[也 


遇 性 描述 ， 输 出 1 维 实 值 向 量 。 设 只 有 一 
层 节 点 数 为 na， 以 第 k 个 样本 为 例 。 输 入 层 神经 元 
为 X = [xF, x#,... xk]， 隐 舍 层 神经 元 为 H = [7 PR ]， 输 出 
神经 元 为 0 = [ok o4, .ok,]， Wi 表示 输入 层 第 i 个 神经 元 
人 层 第 k 个 神经 元 之 间 的 连接 权 值 ，W 表示 隐 含 
bi 层 第 j 个 神经 元 之 间 的 连接 权 值 ， 隐 含 层 的 激发 
函数 为 Ft， 输出 层 的 激发 函数 为 f?， 碾 ,表示 隐 含 层 各 神经 元 


人 D 当 样本 集 
算 误差 E = 二 Ri Bx 
I 果 误 差 满足 精度 要 求 就 结束 ， 否 则 转 到 b) 继 续 。 


的 阔 值 ，22 表示 输 昌 


0-1 的 随机 数 ; 
b) 设 定 输入 向 
{Xs yr) N=; 
9 对 每 个 训练 村 


i 个 节点 的 输 昌 


上层 各 神经 元 的 阔 值 。 


bn.、b82, E (一 1,1)。BP 神经 网 络 算法 流程 如 下 : 
a) 初 始 化 权 值 与 阐 值 , Wi;、Wi% 设 置 为 0, b4.、ba 设 


。BP 算法 的 基本 思想 是 : 学 
FE 向 传播 与 误差 的 反 向 传播 两 个 过 程 组 成 。 BP 
、 一 个 或 多 个 隐 含 层 以 及 输出 层 构 成 。 给 
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Ph 所 有 档 


神经 网 络 实质 上 实现 了 一 个 从 输入 到 输出 的 映射 功 角 
学 理论 已 证 明 它 具有 实现 任何 复杂 非 线性 映射 的 功能 ， 


本 ， 计 算 各 层 输出 ， 以 第 K 个 训练 样本 为 
上 为 下 = f1((xf x whi + x x wiz + 
… 二 礁 xwia)+ 中 )， 输 出 层 第 i 个 节点 的 输出 为 0 = 
f2° (hk x we + hk x we t+ + hs x wh) + b2,); 

每 个 训练 样本 ， 计 算 实际 输出 与 期 望 输出 的 误差 ， 
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非 线 性 函数 的 全 局 极 值 ， 因 此 ， 算 法 很 有 可 能 陷入 局 
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1.3 一 种 基于 BP 和 朴素 贝 叶 斯 的 时 间 序 列 分 类 模型 


本 文 将 BP 神经 网 络 和 朴素 贝 叶 
BP 神经 网 络 的 特征 抽取 能 力 及 朴素 贝 
数据 下 的 分 类 能 力 ， 提 出 BP_NB 算法 
自 的 不 足 , 降 低 了 传统 时 间 序 列 分 类 方法 的 特征 和 
提高 了 在 少量 标记 数据 下 的 分 类 准确 率 。 基 于 
法 ， 构 建 一 个 时 间 序 列 分 类 模型 ， 着 重 
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分 类 器 结合 起 来 ， 利 用 


叶 斯 分 类 器 在 少量 训练 
， 较 好 地 解决 了 两 者 各 
由 取 的 复杂 性 ， 
提出 的 BP_NB 算 
的 


于 只 有 少量 标记 数据 
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类 模型 


a) 数 据 预 处 理 ， 去 除 异 常 值 、 归 一 化 ; 
b) 构 建 模型 ,根据 BP_NB 算法 训练 得 到 k 个 不 同 参数 的 分 


类 器 ; 
0) 将 原始 测 
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d) 用 k 组 测 


试 数 提 


居 输 入 至 
层 的 值 作为 k 组 测试 数据 ; 
试 数据 对 b) 
效果 最 好 的 一 个 作为 最 终 模 型 


| k 个 训练 好 的 BP 网 络 ， 将 其 隐 


bP 得 到 的 k 个 分 类 器 作 测试 ,选取 


应 用 情况 。 该 模型 有 效 减少 了 传统 时 间 序 列 分 类 算法 抽取 特征 6) 使 用 四 中 的 模型 对 新 的 时 间 序 列 进行 分 类 。 
的 繁琐 过 程 ， 并 且 提高 了 在 此 类 应 用 情况 下 的 分 类 准确 率 。 其 1 为 基于 BP 和 朴素 贝 叶 斯 的 时 间 序 列 分 类 模型 。 
re 
[me | 人 
. ee | 个 
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NN- 中 
> 个 车 
a aon = lem] — sm | 一 一 | 
异常 值 A I ep I 县 
和 : 县 
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构建 模型 
图 1 基于 BP 和 朴素 贝 叶 斯 的 时 间 序列 分 类 模型 
本 文 提出 的 BP_NB 算法 , 首先 通过 原始 训练 集训 练 BP 神 给 入 层 隐 含 层 栓 出 层 


经 网 络 ， 然 后 通过 训练 好 的 
取 ， 得 到 新 的 训练 集 和 测试 集 ; 


据 进行 降 维 ， 即 特征 
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用 新 的 
分 类 标记 。 


现 对 本 文 提 出 的 BP_NB 算法 原理 做 详细 介绍 。 
练 集 共有 1 个 样本 数据 ， 每 个 样本 数据 步 长 ( 
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个 类 别 , 如 


第 一 类 别 。 


训练 集 


2 所 示 ， 如 第 一 个 样本 元 改 
二 步 长 的 值 为 -1.677.…. 


第 


2 Ce] (Cm) Cw) 


OOO. 


X | 
1 2 3 


图 


2 原始 训练 和 


n 步 长 的 值 为 -1.715, 样本 xl 属于 


一 步 长 的 值 为 -1.418， 


n 


局 


首先 构建 如 图 3 所 示 的 3 层 BP 神经 网 络 ， 输 入 层 共 mn 个 


节点 ， 输 出 层 两 个 节点 ， 隐 含 层 节点 为 m 个 ，m 应 该 小 于 n; 


最 终 j 


其 次 利用 1.2 小 节 的 方法 ， 使 ) 


3 ”BP 神经 


网 络 


训练 集训 练 该 网 络 ， 保 存 


| 练 完成 时 的 权 值 与 仿 


前 两 层 ， 如 图 4 所 示 。 


置 ， 并 重新 构建 出 训练 好 的 网 络 的 


4 


训练 好 的 BP 神经 网 络 的 前 两 层 
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之 后 将 将 训练 集 重新 输入 图 4 的 网 络 ， 得 到 该 网 络 的 输出 
值 ， 即 原始 数据 的 特征 值 ， 如 图 5 所 示 ， 此 时 xl 样本 数据 第 一 
步 长 的 值 为 0.123..…….. 第 m 步 长 的 值 为 0.234, 新 的 训练 集中 的 
每 个 数据 都 从 nn 个 步 长 减 小 为 m 个 步 长 (m<n)， 可 以 认为 这 

个 步 长 的 数据 是 之 前 n 个 步 长 数据 的 特征 值 ; 


7 


A 


新 的 训 综 集 


Ge) + (em) 


图 5 新 的 训练 外 

对 于 测试 集 数据 ， 如 图 6(a) 所 示 , 输入 到 图 4 训练 好 的 BP 
网 络 中 ， 可 得 到 新 的 测试 集 数 据 ， 其 中 每 个 数据 仍 是 由 n 个 步 
长 减 小 为 m 个 步 长， 如 图 6(b) 所 示 。 


tl 


TT 


测试 集 新 的 普 试 集 


‘多 -© 
‘000“0 :O00 


(a) 测试 集 (b) 新 的 测试 和 
图 6 测试 集 和 新 的 测试 集 

最 后 利用 新 的 训练 集 ， 根 据 1.1 节 的 步骤 构建 朴素 贝 叶 斯 
分 类 器 ， 再 根据 该 朴素 贝 叶 斯 分 类 器 对 新 的 测试 集 数据 进行 标 
记分 类 。 有 具体 过 程 如 图 7 所 示 。 


A 


Re -A A 
Ym) 
新 的 公 斌 集 公开 集 
“OO.…O “3 + 全 
= | 提供 计算 = 村 
一 、 一 、 P(c) 、P(x, jc) 全 
*() 二 由 “的 了 人 


Ea \ 由 
hnp(x) = argmax P(c) [I P(xilc) 
i=1 


基于 新 的 训练 集 构建 的 朴素 贝 叶 斯 分 类 器 


图 7 对 测试 集 数据 i 
提出 的 BP_NB 算法 的 伪 代 码 如 下 : 
算法 1 BP_NB 算法 

function BP_NB(Origin_Train, n_input, n_hidden, n_output, n_epoch) 


行 分 类 


7 


Origin_Train: 训练 全 


乍 其 


Chin 
王 会 青 ， 等 : 一 种 基于 BP :hina iyA A 型 


n_input: BP 神经 网 络 输入 节点 数 
n_hidden: BP 神经 网 络 隐 含 层 节 点 数 


n_output: BP 神经 网 络 输出 节点 数 
n_epoch: 训练 BP 神经 网 络 次 数 


bpnn = 根据 n_input, n_hiddeen,n_output 构建 3 层 BP 神经 网 络 ; 


n=0; 


forn<n eopch do 


使 用 Origin_Train 训练 bpnn; 
n+t+; 
end for 
Bayes_Train = get_bpnn hidden(Train); 
Bayes_Test = get_bpnn_hidden(Test); 
bp_nb_classifier = 用 得 到 Bayes_Train 数据 构建 朴素 贝 叶 斯 NB 分 类 器 


return bp_nb_classifier 


end function 


function get_bpnn_hidden(Data) 
Data: 数据 全 


trained_bpnn = 获取 训练 好 的 BP 神经 网 络 


mr 


将 Data 输入 到 trained_bpnn; 


hidden_output = trained_bpnn 隐 含 层 的 值 ; 
return hidden_output 


end function 
2 ”实验 与 分 析 


2.1 实验 环境 与 数据 
实验 环境 为 TensorFlow 1.2.1、scikit-learn，Windows 10 专 
业 版 ，8 GB 内 存 ，Intel CoreCMi7-3770 CPU@ 3.40 GHz。 
实验 数据 采用 UCR 时 间 序 列 分 类 数据 (UCR time series 
classification archive) [11。 选取 了 九 组 来 源 不 同 的 时 间 序 列 数 据 
进行 实验 。 由 于 本 文 提 出 的 算法 是 针对 少量 标记 时 间 序 列 数 据 


的 应 用 情况 ， 对 于 每 个 数据 集 的 训练 集 ， 只 选取 少量 数目 作为 
此 次 实验 的 训练 集 。 实 验 数 据 具体 信息 如 表 1 所 示 。 
表 1 数据 信息 
数据 名 称 数据 长 度 ”训练 集 数目 ”测试 集 数 分 类 数 
Beef 470 30 30 5 
Gun-Point 150 20 150 2 
Trace 275 20 100 4 
ItalyPowerDemand 24 10 1029 2 
Lightning-7 319 35 73 7 
OSU Leaf 427 30 242 6 
Wafer 152 10 6174 2 
WordSynonyms 270 125 626 125 
Yoga 426 10 3000 2 
2.2 ”实验 结果 与 分 析 
本 文 将 对 比 提出 的 BP_NB 分 类 算法 与 传统 的 基于 DTW- 
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axiv 合 作 中 


Chi 胃 和 
王 会 青 ， 等 : 一 种 基于 BP yl EA 


1NN 分 类 算法 、SAX-1NN 算法 、BP 神经 网 络 算法 、 朴 素 贝 叶 ”损失 可 以 较 快 地 收敛 。 图 8 和 9 分 别 是 BP 神经 网 络 在 数据 集 


斯 算法 以 及 LSTM 神经 网 络 算法 在 上 述 九 个 数据 集 上 的 分 类 效 ”Beef 和 Gun-Point 上 的 训练 损 Re 图 。 


果 , 以 实验 测试 集 的 分 类 准确 率 来 评价 几 种 算法 的 优 劣 . 中 横 轴 代 表 训 练 次 数 ， 纵 轴 为 交叉 炉 训练 误差 。 图 (a)~(d) 分 别 
实验 1 BP 神经 网 络 训练 次 数 的 选择 代表 BP 神经 网 络 隐 含 层 节点 数 hs 为 5、20、100 和 500 的 情 
神经 网 络 训练 次 数 的 设置 一 般 需 要 根据 实验 结果 手动 调整 。 况 。 


在 标记 数据 不 足 的 情况 下 ， 神 经 网 络 由 于 训练 样本 较 少 ， 训 练 


所 ~ 
o a o 


训 红 交 又 粹 损失 
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图 8 ”BP 神经 网 络 在 Beef 数据 集 上 的 训练 损失 


10 
08 
08 
06 
| 04 
N 
02 和 02 


训练 交叉 炳 损失 
8 
训练 交叉 炳 损失 


00 00 
1000 i 
le i 
(ai hs=5 (by hs=20 
08 08 
07 071 
061 06 
05 05 
中 04 04 
如 03 03 
却 021 021 
01 011 
00 ls 
1000 1000 
”i 训 绮 次 数 
{cy hs=100 (d) hs=500 


图 9 BP 神经 网 络 在 Gun-Point 数据 集 上 的 训练 损失 


从 图 8、9 中 可 以 看 到 ， 在 隐 含 层 节 点 数 较 少 时 ，BP 神经 和 9 所 示 , 在 不 同 数据 集 及 不 同 隐 含 层 个 数 设置 下 ,，BP 神经 网 
网 络 需要 更 多 的 训练 次 数 训练 损失 才 可 达到 收敛 ， 隐 舍 层 节点 。 络 有 训练 200 多 次 就 达到 稳定 的 ， 也 有 训练 700 次 才 达 到 稳定 


个 数 较 多 时 ，BP 神经 网 


络 的 训练 损失 可 以 较 快 地 收敛 。 如 图 8 ”的 ,为 了 方便 实验 , 本 文 将 训练 次 数 num_epoch 设置 为 1000， 


201804.02403v1 


chinaXiv 


录用 稿 


可 以 保证 BP 神经 网 络 在 不 同 数据 集 上 有 效 训练 ， 也 方便 实验 
对 比 其 他 参数 对 分 类 结果 的 影响 。 

实验 2 BP 神经 网 络 隐 含 层 的 个 数 对 BP_NB 算法 的 影响 

本 文 构建 的 BP 神经 网 络 为 三 层 结 构 ， 输 入 层 节点 个 数 为 
时 间 序 列 数据 的 数据 长 度 ， 输 出 层 节 点 个 数 为 时 间 序 列 数据 的 
数据 类 别 数 。 中 间 隐 含 层 节点 数目 本 文采 取 网 格 搜索 方式 进行 
设置 。 从 表 1 中 可 以 看 出 实验 的 数据 集 的 数据 长 度 从 24 到 470 


Beef 激 据 集 分 类 准确 率 


-5 hs=10 hs=20 hs=30 hs=50 hs=100hs=2( Jhs=400hs=5 


不 等 ， 因 此 本 文 分 别 实验 隐 含 层 个 数 为 5、 


100、200、300、400、500 时 BP 神经 网 络 及 提 
法 的 分 类 效果 。 图 10 是 BP 神经 网 络 和 BP_NB 算法 在 Beef、 

ItalyPowerDemand、Gun-Point、WordSynonyms 数据 集 上 设置 不 
同 隐 含 层 节点 数 的 分 类 准确 率 。hs 代表 隐 含 层 节点 数 ，bp 代表 
BP 神经 网 络 算法 ，bp_nb 代表 BP_NB 算法 。 


ltalyPowerDeman d 党 d 据 集 分 类 准确 这 


iv 合作 期 乔 


Chi 
王 会 凋 ， 等 ;一 种 基于 BP 和 乔 烛 内 VR 


类 模型 


10、20、30、50、 
出 的 BP_NB 算 


he=10 } ph hs=5 ) J0hs=3 400hs=5 
hs=5 hs=1( 2 0 hs=50 hs=100hs=200h )hs=400h: ) 
bp wbp nb 


ta) 


(b) 


Gun-Poin 庙 xd 和 集 分 类 准确 率 


ubp wbp nt 


WordSyn [ 


tc 


从 图 10 中 可 以 看 到 ， 本 文 提出 的 BP_NB 较 BP 神经 网 络 
算法 普遍 具有 较 高 的 分 类 准确 率 。BP_NB 算法 与 BP 神经 网 络 
的 分 类 效果 随 不 同 隐 含 层 节 点 数 的 变化 规律 较为 一 致 。 选 择 不 
同 的 隐 含 层 节点 数 ， 对 于 最 终 的 分 类 结果 有 较 大 的 影响 ， 但 对 
于 不 同 的 数据 集 并 没有 一 个 统一 的 规律 。 在 Beef、 
ItalyPowerDemand 及 Gun-Point 数据 集 下 ， 分 类 准确 率 随 着 隐 
含 层 节 点 数 的 增加 而 呈现 先 增加 后 降低 的 规律 ， 而 对 于 
WordSynonyms 数据 集 ， 分 类 准确 率 基 本 上 随 着 隐 含 层 节 点 数 
的 增加 而 增加 ; 在 Beef 和 ItalyPowerDemand 数据 集 下 ， 隐 含 
层 节点 数 为 100 时 分 类 准确 率 最 高 ; 而 在 Gun-Point 数据 集 下 ， 
隐 含 层 节点 数 为 20 时 分 类 准确 率 最 高 ; 在 WordSynonyms 数据 
集 下 ， 隐 含 层 节点 数 为 500 时 分 类 准确 率 最 高 。 本 文 分 析 这 与 


图 10 ”BP 神经 网 络 和 BP_NB 算法 在 不 同 数据 外 


(由 


上 的 分 类 准确 率 


表 2 不 同方 法 在 不 同 数据 集 上 分 类 准确 率 


DTW- 


SAX- 


数据 集 NB BP BP NB LSTM 
INN INN 
Beef 0.733 0.753 0.888 0.941 0.951 0.886 
Gun-Point 0.633 0.623 0.684 0.746 0.793 0.786 
Trace 0.699 0.659 0.644 0.699 0.735 0.633 
ItalyPowerDemand 0.888 0.862 0.888 0.941 0.951 0.888 
Lightning-7 0.669 0.663 0.602 0.643 0.684 0.493 
OSU Leaf 0.328 0.325 0.252 0.268 0.326 0.289 
Wafer 0.866 0.732 0.620 0.688 0.943 0.932 
WordSynonyms 0.377 0.355 0.340 0.246 0.378 0.185 
Yoga 0.525 0.521 0.491 0.512 0.531 0.537 


每 个 数据 集 的 特点 有 关 ， 对 于 不 同 的 数据 集 ， 最 佳 隐 含 层 个 数 
不 同 ， 因 此 提出 的 分 类 模型 中 采用 网 格 搜索 的 方式 对 其 进行 设 


加 
o 


实验 3 不 同方 法 在 不 同 数据 集 的 分 类 比较 

本 实验 比较 了 提出 的 BP_NB 算法 与 其 他 分 类 算法 的 分 类 
效果 。 其 中 NB 代表 朴素 贝 叶 斯 算法 ，BP 代表 BP 神经 网 络 算 
法 ，BP_ NB 代表 BP_ NB 算法，LSTM 代表 LSTM 神经 网 络 算 


从 表 2 中 可 以 看 
贝 叶 斯 算法 对 于 九 个 数据 集 ， 
方法 在 WordSynonyms、Yoga 数据 集 上 表现 与 提 
提出 的 BP_NB 算法 在 其 他 数 扩 


法 表现 接近 ， 但 本 文 


b ,DTW-INN 算法 较 SAX-1NN 和 朴素 
平均 表现 更 好 ， 并 且 DTW-1NN 
出 的 BP_NB 算 
昌 集 上 表现 


均 要 好 于 DTW-1NN 算法 。LSTM 神经 网 络 算法 在 某 些 数据 集 
上 与 BP_NB 算法 表现 也 较为 接近 , 但 整体 上 BP_NB 算法 的 分 


类 准确 率 高 于 LSTM 神经 网 络 算法 。 本 文 提 
在 只 有 少量 标记 样本 作为 训练 集 的 时 间 序 列 二 分 类 问题 、 多 分 


法 。 基 于 SAX-1NN 的 符号 数 选 为 5 或 6。 LSTM 的 参数 设置 也 
采用 网 格 搜索 。 表 2 为 不 同 算 法 在 9 个 数据 集 上 分 类 准确 率 的 
比较 。 其 中 SAX-1NN、BP 神经 网 络 、.LSTM 神经 网 络 和 BP_NB 
算法 均 为 其 在 不 同 参 数 设置 下 分 类 效果 最 好 的 一 


Ei 


类 问题 以 及 不 同 的 数据 步 长 的 情况 下 均 有 较 高 的 分 类 准 


出 的 BP_NB 算法 
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本 文 提出 的 基于 BP 和 朴素 贝 叶 斯 的 时 间 序 列 分 类 模型 ， 
利用 BP 神经 网 络 的 特征 抽取 能 力 和 朴素 贝 叶 斯 在 少量 标记 数 
据 下 的 分 类 能 力 ， 在 有 效 地 减轻 传统 时 间 序 列 分 类 方法 特征 抽 
取 的 复杂 性 的 同时 提高 了 在 少量 标记 数据 应 用 情况 下 的 分 类 准 
确 度 。 针对 不 同 的 数据 集 , BP 神经 网 络 的 不 同 参数 设置 对 最 终 。 9] 
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